非完全信息动态博弈决策研究在无法准确获知博弈各方收益、结构、类型等信息(“非完全信息”)下博弈各方先后行动(“动态”)的博弈决策问题。该类问题在复杂经济活动、网络安全和人机对抗等领域有广泛的用途,一直是博弈论研究的热点之一(missing reference)。

在人工智能时代不确定复杂环境的巨大变化导致非完全信息形态发生了本质变化,进而使得非完全信息动态博弈决策理论面临着全新的挑战。数据量的大规模增长、机器智能的巨大飞跃和人机对抗等应用的飞速发展分别形成了“信息大数据”、 “算法高智能”和“对抗强动态”复杂环境,进一步导致了巨量数据不能直接利用的“不可用”非完全信息形态、深度学习算法不可解释的“不可知”非完全信息形态和对抗欺骗状态下“不可信”非完全信息形态(missing reference)。

传统非完全信息动态博弈决策理论针对上述非完全信息形态具有本质局限性, 亟需全新的理论和方法。例如,在人机对抗未来战争场景下,需要解决从大量传感器和情报单位收集的大量数据在动态博弈框架下的可用性问题,解决利用人工智能算法赋能的带有相当自主性(但很难解释而不可知)的无人机与人的合作及动态决策问题,解决对抗方的虚假欺骗信息在动态博弈框架下的处理并满足实时对战要求, 等等。尽管美国辛辛那提大学设计的 AI 战斗系统已经能够在 2016 年的多人飞行模 拟测试中打败前美国空军上校李· 吉恩,但一般场景下的人机对抗仍困难重重,在传统非完全信息动态博弈决策框架下无法简单解决。

“不可用”、“不可知”和“不可信”新型非完全信息下的动态博弈决策要求将对抗学习、强化学习、控制论等新的解决工具有机融合到动态博弈框架下,构建全新的智能基础模型和相应的动态博弈决策理论。

这一研究刚刚起步,但其未来相信会带来巨大变革:这首先是对传统非完全信息动态博弈理论在人工智能时代的重塑;其次,对抗学习、强化学习、控制论和动态博弈论的融合也会带来全新的人工智能理论和技术发展。抓住当前的机遇窗口, 在这一特定领域实现赶超和引领,将有助于我国人工智能产业的持续发展与深度应用。

参考文献

    相关科研项目

    复杂环境下非完全信息博弈决策的智能基础模型研究